訪談測試的準備
在前面的文章中,我說明了使用者測試計畫。根據這個計畫,我進行了以下訪談測試的準備:
-
功能性測試:一個包含了 10 個功能的清單,確認它們是否能正常運作。
-
引導性測試:在給予簡單的測試說明後,觀察測試者能否順利的完成六個步驟,並記錄他們在過程中的反應。
這些測試的內容比較簡單,我認為它們只適合用做第一輪的核心功能測試。當產品越來越完善、複雜時,會需要設計更系統化的測試內容,或是針對特定的功能進行深度的模擬、檢測。
測試者背景簡介
這次測試邀請了三位測試者,他們在年齡、職業、使用習慣和健康管理需求上與Persona高度符合,能夠反映出目標客群的需求。這三位測試者分別是:
- 測試者 A:38 歲的軟體工程師,經常外食、久坐,希望降低體脂。
- 測試者 B:33 歲的自由工作者,喜歡點外送,不常運動,希望降低體重。
- 測試者 C:33 歲的上班族,很多聚餐,喜歡吃零食,希望降低體脂和體重。
測試結果分享
引導性測試
引導性測試是為了瞭解使用者對服務的流程能否正確的理解,因此,這裡是從使用者的角度出發的觀察。
從以下表格可以看到,基本上沒有出現「無法繼續流程」的情況。不過,有兩個流程顯示有改善的空間。
-
打招呼:測試者成功的完成「提供自己偏好的暱稱」的過程。不過,有一位測試者提問「這真的必要嗎?」這讓我意識到,或許不是每個人都認為使用暱稱稱呼很重要,就像我們一般使用 GPT 時,它也不會特別詢問我們偏好的稱呼。
-
設定飲食控制目標:三位測試者一致反映「同時問太多問題」。他們表示,在手機上使用 LINE,當訊息太長時,讀起來很辛苦。還有要一次編輯好幾個問題的回答,也覺得很麻煩。測試者 A 建議將問題預設選項,這樣回答起來會更輕鬆。
功能性測試
功能性測試是了解產品的各項功能,是否有被正常的觸發、運作。
結果呈現如下方表格。有兩個功能錯誤,三個功能有待改善。
錯誤的功能
- 提醒功能沒有正確的觸發,不管是在 Coze 中設定的固定 Trigger 還是使用者自行設定的提醒 Trigger,都沒有正確的運作,顯示這兩個平台之間的連動有問題。
- 在同樣使用 GPT 4o-mini 的模型下,兩位測試者上傳照片,都能正常的解讀食物內容;但一位測試者遇到 Bot 堅持它只能讀取文字的情況。發生故障的原因還不明確。
這兩個問題,雖然不是最核心的功能,但是為了良好的使用者體驗,很需要盡快修復,或是完全將他們從產品的說明中移除。
待改善的功能
- 打招呼的功能似乎有點邏輯混亂,系統兩次重複詢問使用者偏好的暱稱,需要重新調整 Workflow 和 Line 招呼語的順序。
- 在使用者設定提醒時,Bot 有說明最多只能設定兩個,但是當測試者嘗試新增更多提醒時,Bot 沒有阻止,這可能會讓後續的運行邏輯混亂。
- 提供當日回饋的指令,不是那麼好記憶,因此可以觀察到使用者用不同的語言來總結。然而,不是每次都能觸發總結功能成功,像是當測試者輸入「結束」時,Bot 直接結束了對話。
測試的心得
這一次的測試結果,帶來很豐富的回饋。
我的感想是,「吃吃記帳」的流程和功能大致運作良好,可是穩定性有待加強,而且部分操作步驟和使用者體驗上還有提升的空間。不過,三位測試者都對吃吃記帳充滿期待,對於它靈活的回答和個性感到驚艷,也讓我感到很滿足。
下一篇文章,我將根據這些測試結果,制定產品的進一步規劃。